JSAI2026 図表理解に基づく技術文書検索のためのRAGシステム
テーマ
技術文書検索において、図表を含むPDFから回答根拠ページを探すRAGシステムの研究 製造、ITインフラ領域
生成回答そのものよりも、適切な参照箇所をどう絞り込むかに重点がある 背景課題
技術文書では、似た表現でも利用場面が異なる情報が多い
参照範囲を限定しづらい
BM25は型番・コードなどの厳密一致には強いが、同義語や言い換えに弱い 通常のチャンク検索では、章・節・図表などの文書構造が失われやすい
提案
文書を事前にLLMで解析し、構造化メタデータを作る
メタデータは2種類(ページ単位で読み込んで構築)
固定スキーマ
文書構造を表す
タイトル、概要、章・節ごとの要約
利用目的別スキーマ
トラブルシューティング、メンテナンスなどの目的ごとの情報
ある意味、大分類(親階層)を作っているようなものかも daiiz.icon
関連するページ番号も保持する
これを持っておくのいいアイデアだ daiiz.icon
検索時
単純な類似度検索はしない
LLMが目的と文書構造を見て段階的に絞り込む
検索フロー
ユーザ質問から利用目的を分類
カテゴライズ
目的に合う文書を選択
カテゴリに紐づく文書の特定
章節要約で大まかな範囲を絞る
ここでの検索手法は?daiiz.icon
利用目的別メタデータで関連ページを特定
該当ページをマルチモーダルLLMに渡し、図表も含めて回答生成
具体的には何を渡し、どのような表現でユーザーに返す?daiiz.icon
→ ページ単位でPDFファイル(画像として)をそのまま渡す
これは提案手法の範疇外かも
評価
技術文書5244ページ、質問100件(さらに多く)で評価
比較対象: Vector-based RAG と BM25 指標: Precision / Recall / F1
この研究もRetriever性能を検証することにフォーカスしているな daiiz.icon 結果
提案手法
検索関連メトリクス(P / R / F1)で優位
RAG
順位付け、回答品質(MRR / Answer Correctness / Success )で優位
文書構造と利用目的で絞り込むことで、目的外の類似ページを減らせた